花费 6 ms
机器学习常用模型

(原作:MSRA刘铁岩著《分布式机器学习:算法、理论与实践》。这一部分叙述很清晰,适合用于系统整理NN知识) 线性模型 线性模型是最简单的,也是最基本的机器学习模型。其数学形式如下:g(X; ...

Mon Nov 26 18:22:00 CST 2018 0 13720
统计决策——贝叶斯决策理论(Bayesian Decision Theory)

(本文为原创学习笔记,主要参考《模式识别(第三版)》(张学工著,清华大学出版社出版)) 1.概念 将分类看做决策,进行贝叶斯决策时考虑各类的先验概率和类条件概率,也即后验概率。考虑先验概率意味着对 ...

Fri Jan 05 06:45:00 CST 2018 2 14952
PyTorch中的Batch Normalization

Pytorch中的BatchNorm的API主要有: 一般来说pytorch中的模型都是继承nn.Module类的,都有一个属性trainning指定是否是训练状态,训练状态与否将会影 ...

Mon Aug 05 23:55:00 CST 2019 0 3315
PyTorch Softmax

PyTorch provides 2 kinds of Softmax class. The one is applying softmax along a certain dimension. Th ...

Tue Apr 02 19:14:00 CST 2019 0 2560
PyTorch Notes | PyTorch 编程实践笔记

[ 今天最开心的事情! ] PyTorch的stable版本更新为1.0之后,原本3D模型无脑out of memory、3D模型torch.backends.cudnn.benchmark必须Fa ...

Tue Nov 06 06:14:00 CST 2018 0 2752
mixup: Beyond Empirical Risk Minimization

这篇论文MIT和FAIR的工作,主要是提出了一种mixup的方式。(感觉是一种产生hard sample的方法,是一种新的、更有效的数据增强。) 1 Introduction 大网络需要大数据,目 ...

Thu Mar 28 05:50:00 CST 2019 0 1347
深度神经网络训练の显存过载计算

在深度学习训练中,我们经常遇到 GPU 的内存太小的问题,如果我们的数据量比较大,别说大批量(large batch size)训练了,有时候甚至连一个训练样本都放不下。但是随机梯度下降(SGD)中, ...

Wed Dec 26 17:40:00 CST 2018 0 888

 
粤ICP备18138465号  © 2018-2026 CODEPRJ.COM